import pandas as pd
import os
import numpy as np
# 合并县域统计年鉴
inputdir = r'F:\study\耦合协调度\云南县域统计年鉴2011'
df_empty = pd.DataFrame()
n = 0
zb = []
dw = []

df = pd.read_excel('data/年鉴统计数据/县级行政区.xlsx', '县级行政区')
xzq=np.array(df['行政区'])
print(xzq)
for parents, dirnames, filenames in os.walk(inputdir):
    for filename in filenames:
        n += 1
        # header：指定作为列名的行，默认0，即取第一行的值为列名。数据为列名行以下的数据；若数据不含列名，则设定 header = None。
        df = pd.read_excel(os.path.join(inputdir, filename), header=1)
        rows = df.shape[0]
        cols = df.shape[1]
        print('行----------------' + str(rows))
        print('列----------------' + str(cols))
        df.drop(34, axis=0, inplace=True)  # 去掉第0行
        df.drop(columns="指标", axis=1, inplace=True)
        df.drop(columns="单位", axis=1, inplace=True)

        print(df)
        for column in df.columns:
            if column not in xzq:
                df.drop(columns=column, axis=1, inplace=True)
        df2 = pd.DataFrame(df.values.T, index=df.columns)  # 转置
        print(df2)
        df_empty = df_empty.append(df2)
print('----------------------------df_empty----------------------------------')
print(df_empty)
df_empty.to_excel('2011.xlsx')